智能论文笔记

GAN-based Super-Resolution and Segmentation of Retinal Layers in Optical coherence tomography Scans

Paria Jeihouni , Omid Dehzangi , Annahita Amireskandari , Ali Rezai , Nasser M. Nasrabadi

分类：计算机视觉

2022-06-28

在本文中，我们设计了一种基于生成的对抗网络（GAN）的解决方案，用于视网膜层的光学相干断层扫描（OCT）扫描的超分辨率和分割。 OCT已被确定为成像的一种非侵入性和廉价的模态，可发现潜在的生物标志物，以诊断和进展神经退行性疾病，例如阿尔茨海默氏病（AD）。当前的假设假设在OCT扫描中可分析的视网膜层的厚度可能是有效的生物标志物。作为逻辑第一步，这项工作集中在视网膜层分割的挑战性任务以及超级分辨率的挑战性任务上，以提高清晰度和准确性。我们提出了一个基于GAN的细分模型，并评估合并流行网络，即U-NET和RESNET，在GAN体系结构中，并具有其他转置卷积和子像素卷积的块，以通过将OCT图像从低分辨率提高到高分辨率到高分辨率的任务。四个因素。我们还将骰子损失纳入了额外的重建损失项，以提高该联合优化任务的性能。我们的最佳模型配置从经验上实现了0.867的骰子系数，MIOU为0.765。

translated by 谷歌翻译

Superresolution and Segmentation of OCT scans using Multi-Stage adversarial Guided Attention Training

Paria Jeihouni , Omid Dehzangi , Annahita Amireskandari , Ali Dabouei , Ali Rezai , Nasser M. Nasrabadi

分类：计算机视觉

2022-06-10

光学相干断层扫描（OCT）是未侵入性且易于出现的生物标志物（视网膜层的厚度（可在OCT扫描中可检测到的）），以诊断阿尔茨海默氏病（AD）。这项工作旨在自动细分OCT图像。但是，由于各种问题，例如斑点噪声，小目标区域和不利的成像条件，这是一项具有挑战性的任务。在我们以前的工作中，我们提出了多阶段和多歧视性生成对抗网络（Multisdgan），以在高分辨率分段标签中翻译OCT扫描。在这项调查中，我们旨在评估和比较渠道和空间关注的各种组合与多根式体系结构，以通过捕获丰富的上下文关系以提高细分性能来提取更强大的特征图。此外，我们开发并评估了一个引导的MUTLI阶段注意力框架，在该框架中，我们通过在专门设计的二进制掩码和生成的注意力图之间强迫L-1损失来结合引导的注意机制。我们的消融研究结果在五倍交叉验证（5-CV）中的WVU-OCT数据集结果表明，具有串行注意模块的拟议的多键型提供了最有竞争力的性能，并指导二进制蒙版的空间注意力图。进一步提高了我们提出的网络中的性能。将基线模型与添加指导性注意事项进行比较，我们的结果表明，骰子系数和SSIM的相对改善分别为21.44％和19.45％。

translated by 谷歌翻译

Open Vocabulary Semantic Segmentation with Patch Aligned Contrastive Learning

Jishnu Mukhoti , Tsung-Yu Lin , Omid Poursaeed , Rui Wang , Ashish Shah , Philip H. S. Torr , Ser-Nam Lim

分类：计算机视觉

2022-12-09

We introduce Patch Aligned Contrastive Learning (PACL), a modified compatibility function for CLIP's contrastive loss, intending to train an alignment between the patch tokens of the vision encoder and the CLS token of the text encoder. With such an alignment, a model can identify regions of an image corresponding to a given text input, and therefore transfer seamlessly to the task of open vocabulary semantic segmentation without requiring any segmentation annotations during training. Using pre-trained CLIP encoders with PACL, we are able to set the state-of-the-art on the task of open vocabulary zero-shot segmentation on 4 different segmentation benchmarks: Pascal VOC, Pascal Context, COCO Stuff and ADE20K. Furthermore, we show that PACL is also applicable to image-level predictions and when used with a CLIP backbone, provides a general improvement in zero-shot classification accuracy compared to CLIP, across a suite of 12 image classification datasets.

translated by 谷歌翻译

Dealing with Drift of Adaptation Spaces in Learning-based Self-Adaptive Systems using Lifelong Self-Adaptation

Omid Gheibi , Danny Weyns

分类：机器学习 | 人工智能 | 神经与进化计算

2022-11-04

Recently, machine learning (ML) has become a popular approach to support self-adaptation. ML has been used to deal with several problems in self-adaptation, such as maintaining an up-to-date runtime model under uncertainty and scalable decision-making. Yet, exploiting ML comes with inherent challenges. In this paper, we focus on a particularly important challenge for learning-based self-adaptive systems: drift in adaptation spaces. With adaptation space we refer to the set of adaptation options a self-adaptive system can select from at a given time to adapt based on the estimated quality properties of the adaptation options. Drift of adaptation spaces originates from uncertainties, affecting the quality properties of the adaptation options. Such drift may imply that eventually no adaptation option can satisfy the initial set of the adaptation goals, deteriorating the quality of the system, or adaptation options may emerge that allow enhancing the adaptation goals. In ML, such shift corresponds to novel class appearance, a type of concept drift in target data that common ML techniques have problems dealing with. To tackle this problem, we present a novel approach to self-adaptation that enhances learning-based self-adaptive systems with a lifelong ML layer. We refer to this approach as lifelong self-adaptation. The lifelong ML layer tracks the system and its environment, associates this knowledge with the current tasks, identifies new tasks based on differences, and updates the learning models of the self-adaptive system accordingly. A human stakeholder may be involved to support the learning process and adjust the learning and goal models. We present a reusable architecture for lifelong self-adaptation and apply it to the case of drift of adaptation spaces that affects the decision-making in self-adaptation. We validate the approach for a series of scenarios using the DeltaIoT exemplar.

translated by 谷歌翻译

InterCap: Joint Markerless 3D Tracking of Humans and Objects in Interaction

Yinghao Huang , Omid Tehari , Michael J. Black , Dimitrios Tzionas

分类：计算机视觉

2022-09-26

人类不断与日常对象互动以完成任务。为了了解这种相互作用，计算机需要从观察全身与场景的全身相互作用的相机中重建这些相互作用。由于身体和物体之间的阻塞，运动模糊，深度/比例模棱两可以及手和可抓握的物体零件的低图像分辨率，这是具有挑战性的。为了使问题可以解决，社区要么专注于互动的手，忽略身体或互动的身体，无视双手。 Grab数据集解决了灵活的全身互动，但使用基于标记的MOCAP并缺少图像，而行为则捕获了身体对象互动的视频，但缺乏手动细节。我们使用参数全身模型SMPL-X和已知的对象网格来解决一种新的方法，该方法与Intercap的先前工作局限性，该方法是一种新的方法，可重建从多视图RGB-D数据进行交互的整体和对象。为了应对上述挑战，Intercap使用了两个关键观察：（i）可以使用手和物体之间的接触来改善两者的姿势估计。（ii）Azure Kinect传感器使我们能够建立一个简单的多视图RGB-D捕获系统，该系统在提供合理的相机间同步时最小化遮挡的效果。使用此方法，我们捕获了Intercap数据集，其中包含10个受试者（5名男性和5个女性）与10个各种尺寸和负担的物体相互作用，包括与手或脚接触。 Intercap总共有223个RGB-D视频，产生了67,357个多视图帧，每个帧包含6个RGB-D图像。我们的方法为每个视频框架提供了伪真正的身体网格和对象。我们的Intercap方法和数据集填补了文献中的重要空白，并支持许多研究方向。我们的数据和代码可用于研究目的。

translated by 谷歌翻译

Blinder: End-to-end Privacy Protection in Sensing Systems via Personalized Federated Learning

Xin Yang , Omid Ardakanian

分类：机器学习

2022-09-24

本文提出了一个传感器数据匿名模型，该模型接受了分散数据的培训，并在数据实用程序和隐私之间进行了理想的权衡，即使在收集到的传感器数据具有不同的基础分布的异质环境中也是如此。我们称为Blinder的匿名模型基于以对抗性方式训练的变异自动编码器和歧视网络。我们使用模型 - 不合稳定元学习框架来调整通过联合学习训练的匿名模型，以适应每个用户的数据分布。我们在不同的设置下评估了盲人，并表明它提供了端到端的隐私保护，以增加隐私损失高达4.00％，并将数据实用程序降低高达4.24％，而最新的数据实用程序则将其降低了4.24％。对集中数据培训的匿名模型。我们的实验证实，Blinder可以一次掩盖多个私人属性，并且具有足够低的功耗和计算开销，以便将其部署在边缘设备和智能手机上，以执行传感器数据的实时匿名化。

translated by 谷歌翻译

On the Effectiveness of Compact Biomedical Transformers

Omid Rohanian , Mohammadmahdi Nouriborji , Samaneh Kouchaki , David A. Clifton

分类：自然语言处理 | 机器学习

2022-09-07

在生物医学语料库中预先培训的语言模型，例如Biobert，最近在下游生物医学任务上显示出令人鼓舞的结果。另一方面，由于嵌入尺寸，隐藏尺寸和层数等因素，许多现有的预训练模型在资源密集型和计算上都是沉重的。自然语言处理（NLP）社区已经制定了许多策略来压缩这些模型，利用修剪，定量和知识蒸馏等技术，从而导致模型更快，更小，随后更易于使用。同样，在本文中，我们介绍了六种轻型模型，即Biodistilbert，Biotinybert，BioMobilebert，Distilbiobert，Tinybiobert和Cmpactactbiobert，并通过掩护的语言在PubMed DataSet上通过掩护数据进行了知识蒸馏而获得的知识蒸馏来获得。建模（MLM）目标。我们在三个生物医学任务上评估了所有模型，并将它们与Biobert-V1.1进行比较，以创建有效的轻量级模型，以与较大的对应物相同。所有模型将在我们的HuggingFace配置文件上公开可用，网址为https://huggingface.co/nlpie，用于运行实验的代码将在https://github.com/nlpie-research/compact-compact-biomedical-transformers上获得。

translated by 谷歌翻译

The Outcome of the 2022 Landslide4Sense Competition: Advanced Landslide Detection from Multi-Source Satellite Imagery

Omid Ghorbanzadeh , Yonghao Xu , Hengwei Zhao , Junjue Wang , Yanfei Zhong , Dong Zhao , Qi Zang , Shuang Wang , Fahong Zhang , Yilei Shi

分类：计算机视觉

2022-09-06

这里介绍了人工智能研究所（IARAI）组织的2022年Landslide4sense（L4S）竞赛的科学结果。竞争的目的是根据全球收集的卫星图像的大规模多个来源自动检测滑坡。 2022 L4S旨在促进有关使用卫星图像的语义分割任务的深度学习模型（DL）模型最新发展的跨学科研究。在过去的几年中，由于卷积神经网络（CNN）的发展，基于DL的模型已经达到了对图像解释的期望。本文的主要目的是介绍本次比赛中介绍的细节和表现最佳的算法。获胜的解决方案详细介绍了Swin Transformer，Segformer和U-NET等最先进的模型。还考虑了先进的机器学习技术和诸如硬采矿，自我培训和混合数据增强之类的策略。此外，我们描述了L4S基准数据集，以促进进一步的比较，并在线报告准确性评估的结果。可以在\ textIt {未来开发排行榜上访问数据，以供将来评估，\ url {https://www.iarai.ac.ac.at/landslide4sense/challenge/}，并邀请研究人员提交更多预测结果，评估准确性在他们的方法中，将它们与其他用户的方法进行比较，理想情况下，改善了本文报告的滑坡检测结果。

translated by 谷歌翻译

Evolutionary Deep Reinforcement Learning for Dynamic Slice Management in O-RAN

Fatemeh Lotfi , Omid Semiari , Fatemeh Afghah

分类：人工智能 | 机器学习 | 神经与进化计算

2022-08-30

需要下一代无线网络以同时满足各种服务和标准。为了解决即将到来的严格条件，开发了具有柔性设计，分解虚拟和可编程组件以及智能闭环控制等特征的新型开放式访问网络（O-RAN）。面对不断变化的情况，O-Ran切片被研究为确保网络服务质量（QoS）的关键策略。但是，必须动态控制不同的网络切片，以避免由环境快速变化引起的服务水平一致性（SLA）变化。因此，本文介绍了一个新颖的框架，能够通过智能提供的提供资源来管理网络切片。由于不同的异质环境，智能机器学习方法需要足够的探索来处理无线网络中最严厉的情况并加速收敛。为了解决这个问题，提出了一种新解决方案，基于基于进化的深度强化学习（EDRL），以加速和优化无线电访问网络（RAN）智能控制器（RIC）模块中的切片管理学习过程。为此，O-RAN切片被表示为Markov决策过程（MDP），然后最佳地解决了资源分配，以使用EDRL方法满足服务需求。在达到服务需求方面，仿真结果表明，所提出的方法的表现优于DRL基线62.2％。

translated by 谷歌翻译

HTML版本

Influence Maximization (IM) in Complex Networks with Limited Visibility Using Statistical Methods

aeid Ghafouri , Seyed Hossein Khasteh , Seyed Omid Azarkasb

分类：人工智能

2022-08-28

社交网络（SN）是一个由代表它们之间相互作用的群体组成的社会结构。 SNS最近被广泛使用，随后已成为产品推广和信息扩散的合适平台。 SN中的人们直接影响彼此的利益和行为。 SNS中最重要的问题之一是，如果选择将它们作为网络扩散场景的种子节点选择，那么他们可以以级联的方式对网络中的其他节点产生最大影响。有影响力的扩散器是人们，如果他们被选为网络中出版问题中的种子，那么该网络将拥有最多了解该扩散实体的人。这是称为影响最大化（IM）问题的文献中的一个众所周知的问题。尽管已证明这是一个NP完整的问题，并且在多项式时间内没有解决方案，但有人认为它具有子模块化功能的属性，因此可以使用贪婪的算法来解决。提出改善这种复杂性的大多数方法都是基于以下假设：整个图都是可见的。但是，此假设不适合许多真实世界图。进行了这项研究，以扩展使用链接预测技术与伪可见性图的电流最大化方法。为此，将一种称为指数随机图模型（ERGM）的图生成方法用于链接预测。使用斯坦福大学SNAP数据集的数据对所提出的方法进行了测试。根据实验测试，所提出的方法在现实世界图上有效。

translated by 谷歌翻译